期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于BERT和CNN的基因剪接位点识别
左敏, 王虹, 颜文婧, 张青川
《计算机应用》唯一官方网站    2023, 43 (10): 3309-3314.   DOI: 10.11772/j.issn.1001-9081.2022091447
摘要268)   HTML13)    PDF (1829KB)(149)    收藏

随着高通量测序技术的发展,海量的基因组序列数据为了解基因组的结构提供了数据基础。剪接位点识别是基因组学研究的重要环节,在基因发现和确定基因结构方面发挥着重要作用,且有利于理解基因性状的表达。针对现有模型对脱氧核糖核酸(DNA)序列高维特征提取能力不足的问题,构建了由BERT(Bidirectional Encoder Representations from Transformer)和平行的卷积神经网络(CNN)组合而成的剪接位点预测模型——BERT-splice。首先,采用BERT预训练方法训练DNA语言模型,从而提取DNA序列的上下文动态关联特征,并且使用高维矩阵映射DNA序列特征;其次,采用人类参考基因组序列hg19数据,使用DNA语言模型将该数据映射为高维矩阵后作为平行CNN分类器的输入进行再训练;最后,在上述基础上构建了剪接位点预测模型。实验结果表明,BERT-splice模型在DNA剪接位点供体集上的预测准确率为96.55%,在受体集上的准确率为95.80%,相较于BERT与循环卷积神经网络(RCNN)构建的预测模型BERT-RCNN分别提高了1.55%和1.72%;同时,在5条完整的人类基因序列上测试得到的所提模型的供体/受体剪接位点平均假阳性率(FPR)为4.74%。以上验证了BERT-splice模型用于基因剪接位点预测的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于注意力机制的改进CLSM检索式匹配问答方法
于重重, 曹帅, 潘博, 张青川, 徐世璇
计算机应用    2019, 39 (4): 972-976.   DOI: 10.11772/j.issn.1001-9081.2018081691
摘要398)      PDF (752KB)(280)    收藏
针对检索式匹配问答模型对中文语料适应性弱和句子语义信息被忽略的问题,提出一种基于卷积神经网络潜在语义模型(CLSM)的中文文本语义匹配模型。首先,在传统CLSM基础上进行改进,去掉单词和字母的 N元模型层,以增强模型对中文语料的适应性;其次,采用注意力机制算法,针对输入的中文词向量信息建立实体关注层模型,以加强句中核心词的权重信息;最后,通过卷积神经网络(CNN)有效地捕获输入句子上下文结构方面信息,并通过池化层对获取的语义信息进行降维。基于医疗问答对数据集,将改进模型与传统语义模型、传统翻译模型、深度神经网络模型进行对比,实验结果显示所提模型在归一化折现累积增益(NDCG)方面有4~10个百分点的提升,优于对比模型。
参考文献 | 相关文章 | 多维度评价
3. 开放式机器人智体——宿主“软件人”的构建
武丹凤, 曾广平, 肖超恩, 张青川
计算机应用    2015, 35 (6): 1766-1772.   DOI: 10.11772/j.issn.1001-9081.2015.06.1766
摘要515)      PDF (976KB)(475)    收藏

针对机器人功能的更新、修改、升级、维护等工作,普遍只能采用离线、静态方式进行的问题,将"软件人"引入机器人平台中,搭建了以宿主"软件人"为管理中心的机器人系统架构,并重点对宿主"软件人"进行了研究。首先,构造了宿主"软件人"的体系结构;然后,提出了宿主"软件人"知识行为一体化描述模型,并对其知识模型进行了基于数据结构的构造和实现,对其主要服务类行为给出了相应的设计规范及算法的参考实现;最后,将引入宿主"软件人"的机器人系统与网络平台中的"软件人"系统进行合一,经测试,机器人功能的在线、动态更替取得成功,同时也验证了对宿主"软件人"设计、实现方法的正确性和可行性。

参考文献 | 相关文章 | 多维度评价
4. 基于注意力机制的改进CLSM检索式匹配问答方法研究
于重重 曹帅 潘博 张青川 徐世璇
  
录用日期: 2018-11-02